コアコンセプト — 脳と手
これまでの実験では、大規模言語モデル(LLM)の強力さを実感しましたが、同時に大きな欠点も明らかになりました。それは『箱の中』に閉じ込められている点です。彼らは訓練されたデータ以外の情報は知らず、リアルタイムの世界とやり取りできません。
AIエージェント この問題を、2つの異なる要素を組み合わせることで解決します:
- 脳: 人間の言語を理解し、論理処理を行い、会話の文脈を維持する大規模言語モデル(例:Qwen3-4B)。
- 手: 実際にリアルな世界とやり取りできる、Pythonコードや外部ツール(API)—例えば天気の確認、インターネット検索、計算の実行など。
脳に手を使う方法を教える
LLMは自然にボタンをクリックしたり、Pythonを実行したりできません。今日の目標は、脳が助けが必要だと認識できるように教え、その出力を適切にフォーマットして、私たちのPythonプログラムがツールを実行できるようにすることです。 ために それを実行するためです。
